هوشمندسازی| فناوری پردازش گفتار به شناخت پیکره‌های زبان فارسی کمک می‌کند

1400/11/20 - 14:25

زمان مطالعه : 2 دقیقه

کد خبر : 82096

دستیارهای هوش مصنوعی در حوزه تشخیص یا به عبارت دیگر پردازش گفتار نقش پررنگی ایفا می‌کنند.

با توجه به ظرفیت فراوان تجاری‌سازی و کاربردهای متنوع این فناوری، در سالیان اخیر، حمایت از توسعه و پیشرفت دانش تشخیص گفتار انسان با ماشین، به یکی ضرورت در داخل کشور تبدیل شده است.

تشخیص گفتار یا تشخیص گفتار خودکار، فرآیندی است که طی آن، ماشین می‌تواند کلام و گفتار را گوش کرده و آن را پردازش کند، یا به طور مثال آن را تبدیل به متن کند.

به گفته امیر شریفیان مدیر مرکز رصد و ترویج اقتصاد دیجیتال، قدرت پیش‌بینی و یادگیری بی‌نظیر یادگیری عمیق توانسته به ‌ماشین‌ها در راه پیشرفت روزافزون در زمینه تشخیص گفتار، ‌کمک‌های شایان‌توجهی کند. دو راهکار تست این ویژگی ما‌شین‌ها از سایر راهکارها، بسیار پرکاربردتر است.

Librispeech راه‌کار اول است که به تخمین قدرت تشخیص کامپیوترها در تبدیل گفتار به متن در ‌فرکانس‌های مختلف صدایی می‌پردازد.

راهکار دوم، VoxCeleb است که وظیفه آن، انتخاب شخص گوینده گفتار است.‌ ماشین‌ها به کمک یادگیری عمیق در سالیان گذشته، در هر دو زمینه‌، پیشرفت‌های بسیاری کرده‌اند.

خطای پائین‌تر از یک درصد

نرخ تعداد اشتباهات در تشخیص صدای افراد معروف در 4 سال گذشته، از حدود 8 درصد در سال 2016 به زیر 1 درصد در سال 2020 رسیده است.

این افزایش چشم‌گیر دقت، به لطف استفاده از‌ الگوریتم‌های هیبرید و دوگانه متشکل از یادگیری عمیق و راهکارهای الگوریتمیک بسیار‌ پیچیده‌تر به دست آمده است.

توسعه پردازش گفتار در کشور

از آن جا که وجود پیکره‌ها و دیتاست‌های زبان فارسی می‌تواند تا حدود زیادی، عرصه را برای توسعه ابزارهای مختلف در این زمینه مهیا کند، ستاد توسعه اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاست‌جمهوری در تلاش است تا با همکاری برخی از توانمندترین شرکت‌های هوش مصنوعی کشور اقدام به ایجاد پیکره‌های منبع باز برای این حوزه کند.

به طور مثال پروژه نوآوری در پیکره فناوری گفتگوی روزمره زبان فارسی که از مرداد ماه سال 99 آغاز شده است، در مراحل پایانی قرارداد و به‌زودی در دسترس فناوران قرار خواهد گرفت. در حال حاضر یکی دیگر از مشکلات عمده این ‌سیستم‌ها، توانایی پایین در تشخیص لهجه‌ها است.

تاکنون سیستم‌ها و نرم‌افزارهای متعددی در کشور، با هدف برقراری ارتباط انسان و ماشین طراحی و به بازار عرضه شده که گام بلندی در توسعه دانش تشخیص گفتار یا تشخیص گفتار خودکار به حساب آمده و چشم‌انداز شاخص‌های فناوری‌های مربوط به هوش مصنوعی ایران را با رونق همراه کرده است.

از جمله محصولات توانمند داخلی در زمینه پردازش گفتار می‌توان به تایپو آوای، آی‌او تایپ، بیانک، پکتوس، طنینو، دروازه‌های نوین پارس و دستیار صوتی دابی اشاره کرد.

مرکز ارتباطات و اطلاع‌رسانی معاونت علمی و فناوری ریاست جمهوری

#17